Cirrascale Cloud Services a annoncé mettre à disposition des modèles d’intelligence artificielle pour une utilisation sur site via Google Distributed Cloud, une initiative destinée aux entreprises souhaitant bénéficier de capacités IA avancées tout en conservant leurs données derrière leur propre pare-feu. La société a déclaré que les entreprises et les organismes du secteur public pourront exécuter les modèles Gemini soit sur site, soit dans les centres de données de Cirrascale (pas encore présents en Europe), y compris dans des déploiements connectés ou entièrement isolés, pour répondre aux exigences en matière de souveraineté des données et de réglementation. La société a déclaré que cette offre étendait sa plateforme d'inférence pour prendre en charge Gemini sur Google Distributed Cloud, positionnant ainsi le service pour des secteurs tels que l'administration, la défense, la finance, la santé et l'enseignement supérieur. 

À ce jour, Cirrascale n'a pas de présence physique (datacenters) en Europe, mais la société surveille de près ce marché en expansion rapide. Ses opérations sont concentrées aux États-Unis, notamment en US-West et US-East. Lors d'une interview fin 2025, le CEO Dave Driggers a confirmé que l'adoption de l'IA suit un schéma classique - d'abord les États-Unis, ensuite l'Europe, puis l'Asie du Sud-Est - et a relevé des annonces récentes de NCP en Europe comme signal fort d'un marché en train de mûrir.  

Pas de TPU, mais des GPU Nvidia

Cirrascale exécute Gemini sur site sur des serveurs Dell équipés de processeurs et de cartes graphiques Intel et Nvidia, mais n'utilise pas la célèbre unité de traitement Tensor (TPU) de Google. Elle utilise le matériel du texan Dell, y installe Gemini et GDC, et est en mesure de fournir cela en tant que service local aux clients. Dave Driggers a expliqué que les clients n’obtiendraient pas les mêmes performances qu’avec un TPU, mais qu’ils bénéficieraient tout de même de performances plus que suffisantes. « C'est vraiment la seule autre plateforme de formation indépendante de Nvidia qui offre une pile complète : les processeurs, la mise en réseau et la pile logicielle sont tous intégrés de bout en bout », a-t-il déclaré. Cirrascale a indiqué que ce modèle de déploiement est conçu pour les clients soumis à des règles strictes en matière de résidence des données ou ayant des besoins de faible latence, en maintenant les ressources informatiques à proximité du lieu où les données sont stockées et traitées. 

Google Distributed Cloud peut être déployé dans des environnements contrôlés par le client, y compris des installations déconnectées d’Internet, ce qui constitue une exigence clé pour certains utilisateurs du secteur public et des infrastructures critiques. L’un des grands défis réside dans le fait que ces modèles ont une valeur inestimable et doivent être fournis dans un environnement fiable et sécurisé, a déclaré M. Driggers. « C'est vraiment ce qui importe le plus à Google : ce modèle. Il doit donc être fourni dans un environnement informatique confidentiel », a-t-il déclaré. Le modèle n'est pas stocké sur un SSD, mais en mémoire. En cas d'intrusion dans la machine, celle-ci s'éteint automatiquement et le modèle disparaît, ce qui rend son vol impossible, selon Cirrascale. Le fournisseur a déclaré qu’il fournirait les configurations matérielles, l’optimisation des performances et l’assistance nécessaires pour exécuter l’inférence Gemini à grande échelle dans le cadre de sa plateforme Cirrascale Inference Platform. 

Des alternatives chez les NCP européens

La société a indiqué que ce service s’adresse aux clients qui souhaitent disposer d’un environnement de production sans avoir à reconstruire leur infrastructure existante, et qu’il comprend ce qu’elle décrit comme des systèmes optimisés pour l’inférence Gemini ainsi qu’une assistance opérationnelle continue. « C'est le modèle de Google. Notre secret réside dans le fait d'être un partenaire de confiance capable de fournir ce modèle aux clients », a déclaré M. Driggers. « Cela fait partie de notre offre d'inférence en tant que service. Ainsi, pour nos clients, nous disposons d'une couche logicielle au-dessus du modèle qui leur permet de personnaliser son utilisation, afin qu'ils puissent configurer des files d'attente et définir des limites pour les utilisateurs. » Cela permet aux abonnés de s’engager dans la tokenomics pour faire appel à une personne bénéficiant, par exemple, d’un taux de jetons différent d’un programmeur haut de gamme devant accomplir une tâche rapidement. 

Le service peut également répartir Gemini si les clients sont répartis sur plusieurs régions, et l’entreprise assure l’équilibrage de charge pour l’utilisateur final, selon le fournisseur. Le service vient tout juste de lancer ses prévisualisations et sa disponibilité générale est prévue pour fin juin ou début juillet en Amérique du Nord. Pour les clients européens qui souhaitent comparer Cirrascale à des alternatives locales, des plateformes comme Scaleway (basée en Europe) présentent l'avantage de la conformité réglementaire (RGPD, souveraineté des données).